JSAI2026 大規模言語モデルを用いた対話からのユーザ嗜好を考慮した知識獲得

テーマ

対話ログからユーザの嗜好を抽出し、ユーザ嗜好知識グラフ（UPKG）として構造化する研究

目的は、対話AIのパーソナライズを「ブラックボックスな埋め込み」ではなく、説明可能で可搬な知識として扱うこと

LLMパーソナライズ

関連研究

テキストからの嗜好抽出

嗜好の解像度が不足

階層的興味モデリング

解釈困難な埋め込み表現を用いる

提案

対話からUPKGを構築する

ユーザ嗜好知識グラフ

嗜好軸、サブ嗜好軸

スキーマを独自作成

Liking（感情）

Wanting（欲求）

Need（実利）

手法

対話履歴をLLMに入力し、嗜好スキーマに従って明示的嗜好をJSON形式で抽出する

抽出対象は、対象エンティティ、嗜好軸、サブ嗜好軸、極性、強度、文脈タグ

暗黙的嗜好は、発話の背後にある価値観・習慣・行動原理として自然言語で推論する

最終的に、明示的嗜好エッジと暗黙的嗜好ノードを持つUPKGを構築する

データ

面白い結果

単一モデルで全部やるより、モデルの得意領域を分ける方がよさそう

GPT-5.2: 嗜好の骨格を抽出

GPT-4o: 強度や文脈を肉付け

「好きではないが必要」「欲しいが好きではない」のような矛盾を、同一対象に対して保持できる

暗黙的嗜好を自然言語ノードとして残すことで、固定スキーマでは拾えない価値観も扱える

Gemma 3も一部指標でGPT-4o-miniを上回り、ローカルLLM利用の可能性を示した

課題: エンティティ境界決定ミス

シェイクの件

例として "vanilla milkshake" という嗜好対象が出てくる

正しくは、ユーザが好みとして述べた対象を "vanilla milkshake" 全体として取るべき場面がある

しかしLLMが "milkshake" だけを抽出してしまう場合がある

これは、嗜好対象の粒度をどこで切るかが難しい、という問題

回避・否定表現の扱い

「タバコをやめたい」のような表現では、嗜好の対象をどこに置くかが難しい

「タバコ」への Negative Wanting なのか

「禁煙」への Positive Wanting なのか

同じ発話でも、グラフ上のエンティティと極性が変わってしまう

まとめ

写真

このスライドいいな！daiiz.icon